Approche Fouille de Texte pour la détection précoce de tendances économiques

نویسندگان

  • Marilyne Latour
  • Antoine Sigwalt
چکیده

Résumé. Cet article présente un retour d’expérience sur de la fouille de données complexes dans un processus d’extraction des connaissances dans un contexte industriel. Á partir de données volumineuses non structurées issues de dépêches d’actualités économiques et selon certains traitements linguistiques et économétriques, notre objectif est de prédire des tendances économiques dans des séquences d’évènements d’actualités. Pour cela, trois étapes sont primordiales : (i) l’extraction d’indicateurs économiques par des techniques linguistiques (comme les indices boursiers, les taux de change, les noms des monnaies ou encore les cours des matières premières. . .), (ii) l’annotation, par le recours à des terminologies externes, de ces indicateurs économiques : les données extraites portent alors des étiquettes permettant de les identifier, (iii) leur superposition à des modèles statistiques. Á la suite de ce traitement, nous pouvons vérifier si il existe une corrélation entre des indicateurs économiques relevés par l’étude linguistique pour un secteur d’activité donné et sur un territoire donné (la production d’un élément A sur le prix d’un élément B par exemple). L’intérêt de cette méthode est d’apporter des outils linguistiques en complément des méthodes statistiques utilisées habituellement pour faire émerger des données cointégrées. L’article décrit ensuite les expérimentations effectuées et tire les premières conclusions sur divers aspects de cette méthode.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Nouvelle Approche de Corrélation d'Alertes basée sur la Fouille Multidimensionnelle

Résumé. En réponse aux problèmes posés par la complexité croissante des réseaux et des attaques, les Systèmes de Détection d’Intrusions (SDIs) constituent une bonne alternative pour mieux sécuriser un système informatique. Cependant, les SDIs existants présentent des lacunes en terme de génération excessive d’alertes. Réellement, la majorité de ces alertes ne correspondent pas à des attaques (f...

متن کامل

Prévention du déréférencement de références nulles dans un langage à objets

Résumé. Le déréférencement de références nulles est une erreur de programmation courante dans les langages à objets. Pour la prévenir, certaines approches garantissent statiquement son absence à l’aide de systèmes de types ou d’annotations mais réduisent l’expressivité du langage. D’autres approches analysent plutôt le code source pour identifier les erreurs potentielles, mais peuvent trouver d...

متن کامل

L'analyse relationnelle pour la fouille de grandes bases de données

Résumé. Dans cet article nous montrerons, brièvement, les possibilités offertes par la théorie de l'analyse relationnelle, initiée dans les années 1980 à IBMCorp. Nous nous concentrerons sur les avancées théoriques et méthodologiques obtenues grâce à cette théorie pour fusionner l'information et pour traiter et analyser de grandes quantités de données qu'elles soient de type structuré ou non st...

متن کامل

Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch

Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...

متن کامل

Détection et regroupement automatique de style d'écriture dans un texte

Résumé. La détection de plagiat extrinsèque devient vite inefficace lorsque l’on n’a pas accès aux documents potentiellement sources du plagiat ou lorsque l’on se confronte à un espace aussi vaste que le Web, ce qui est souvent le cas dans les logiciels anti-plagiat actuels. Dès lors la détection intrinsèque devient nettement plus efficace. Dans cet article, nous traitons justement de la détect...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014